06. Pre-Notebook:字符级 RNN

Notebook:字符级 RNN

现在你已经掌握了自己实现 RNN 所需的所有信息。下面的几个视频将专门讲解如何使用 LSTM 进行字符级文本预测。

建议使用当前标签页观看课程,同时用新标签页打开 notebook,边学习边操作。

打开 notebook 的方法:

  • 直接在课堂里在线打开(推荐)。
  • Github 克隆代码库,再打开 recurrent-neural-networks > char-rnn 文件夹中的 Character_Level_RNN_Exercise.ipynb。你可以使用 git clone https://github.com/udacity/deep-learning-v2-pytorch.git 下载代码库,或从此链接下载归档文件。

说明

  • 加载文本数据
  • 预处理数据,将字符编码为整数并创建独热输入向量
  • 定义一个 RNN,它会根据给定的输入序列预测下个字符
  • 训练该 RNN 并用它生成新的文本

这是一个自我评估 Lab。如果你需要帮助或想参考答案,请查看同一文件夹里的 solution notebook,或点击此处

GPU Workspace

下个 workspace 支持 GPU,所以你可以选择在 GPU 实例上训练模型。建议做法:

  • 在 CPU 模式(非启用模式)下加载数据、测试函数和模型(检查参数并执行简短的训练循环)
  • 准备好大规模地训练和测试模型时,启用 GPU 以快速训练模型

当做输入的所有模型和数据都必须移到 GPU 设备上,所以请注意模型创建和训练流程中的相关移动代码。